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(57) Abrcgd 

La pre'sente invention a pour objet des sequences nucteiques d'origine plasmidique, prdsentes chez les bact£ries du groupe Escherichia 
coli ent6roh6morragiques (EHEC), l'utilisation desdites sequences pour la recherche des EHEC, notamment ceux poss6dant les genes codant 
pour les facteurs de virulence ent6roh6molysine et intimine, et plus particulierement la detection specifique du s6rotype 0157:H7. L' invention 
vise 6galement un proced6 mettant en oeuvre lesdites sequences ainsi que les trousses de detection les contenant. 
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Sequences nucleotidiques pour la detection des Escherichia Coli 
enterohemorragiques (EHEC) . 

^invention a pour objet deux sequences nucleiques d'origine plasmidique. 
presentes chez les bacteries du groupe Escherichia coli enterohemorragiques 
(EHEC), Tutilisation desdites sequences pour la recherche des EHEC. 
notamment ceux possedant les genes codant pour les facteurs de virulence, 
enterohemolysine et intimine, et plus particuiierement la detection specifique du . 
serotype 0157 :H7. invention vise egalement un procede mettant en ceuvre 
iesdites sequences ainsi que les trousses de detection les contenant. 

Les bacteries du groupe EHEC appartiennent a la f ami lie des Escherichia 
coli producteurs de verotoxines ou VTEC, responsables de syndromes 
diarrheiques dont les consequences peuvent etre fatales chez rhomme. En 
particulier, les EHEC peuvent engendrer des colites hemorragiques (CH). et 
eventuellement I'apparition de complications majeures comme le syndrome 
hemolytique et uremique (SHU) ou ie purpura thrombotique thrombopenique 
(Griffin et'Tauxe, Epidemiol. Rev. 13, 1991, 60-98). 

Aussi, incidence de ces infections sur la sante publique est telle, qu'elle 
implique un controle accru des denrees alimentaires et des moyens de detections 
rapides, notamment en cas d'epidemies. 

Plusieurs serotypes, appartenant au groupe EHEC ont ete identifies et 
rendus responsables de differents foyers epidemiques : 0157:H7, 026:H11. 
0111 :NM, O103 :H2, 0145 :NM etc (Acheson et Keush, ASM News 62, 1996, 
302-306). Cependant, c'est le serotype 0157 :H7 qui a ete le plus frequemment 
isole. 

Les methodes de detection traditionnelles consistent a identifier les 
bacteries ou a deceler les toxines secretees par celles-ci. La detection de E. coli 
0157 :H7 est principalement realisee sur la base du serotypage, associe a la 
recherche de proprietes metaboliques, comprenant Tabsence de fermentation du 
sorbitol et/ou Tabsence d'activite ^-glucuronidase. II n'existe pas, par ailleurs t de 
methode bacteriologique propre a la detection des EHEC, mais des tests 
permettant d'orienter le diagnostic. En particulier, ['utilisation de geloses 
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suppiementees avec clu sang ou des hernaties lavees- permet de mettre en- 
evidence le caractere enterohemolytique, generalement present chez Ies EHEC. 

De maniere generate, Ies methodes bacteriologiques et immunologiques 
relatives a la detection de £. coli 0157 :H7 sont longues, fastidieuses. 
relativement couteuses et necessitent une confirmation serologique. Par ailleurs, 
ces methodes ne permettent pas d'etablir une identification de E. coli 0157 :H7 
du fait des reactions croisees avec d'autres genres et especes bacteriens, ce qui 
rend Interpretation difficile. 

Utilisation de sondes nucleiques est done apparue comme une 
alternative a ces methodes traditionnelies. Des efforts importants ont ete realises 
pour developper des sondes, capables de detecter d'une maniere sensible et 
specifique Ies bacteries E. coli de type EHEC, impliquees dans Ies cas de CH 
et/ou SHU, et dont le prototype le plus repandu est E. coli 0157 :H7. 

En particulier, des sondes ou fragments, permettant la detection des 
genes responsables de la virulence des E. coli, encore appeles facteurs de 
virulence, ont ete publies. Toutefois, aucun des facteurs de virulence 
actuellement connu ne permet a lui seul d'identifier des souches pathogenes de 
E . coli 0157 :H7 ou des EHEC. 

Ainsi, ('utilisation de sondes ou fragments nucleiques pour la detection des 
genes codant pour Ies verotoxines (vt1 ou sf7, vt2 ou st2), decrite par de 
nombreux groupes de recherche (Karch et Meyer, J. Clin Microbiol. 27, 1989, 
2751-2757 ; Gannon et ai , Appl. Env. Microbiol, 58, 1992, 3809-3815 ; Begum 
et at., J. Clin. Microbiol. 3±, 1993, 3153-3156; Witham et al, Appl. Env. 
Microbiol. 62, 1996, 1347-1353), a montre que Ies genes codant pour Ies 
verotoxines sont associes aux souches bacteriennes pathogenes E. coli 
0157 ;H7 et autres EHEC, mais peuvent aussi etre presents chez des souches 
E coli non pathogenes, ou eventuellement chez d'autres genres bacteriens 
comme Shigella dysenteriae, Citrobacterfreundii, etc. 
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De meme, la proteine d'adhesion denommee intimine est egalement 
impliquee dans la virulence des bacteries de type EHEC. Des sondes ont ete 
notamment selectionnees sur le gene correspondant (eae) par Gannon et al. 
dans J. Clin. Microbiol. 3±, 1993, 1268-1274, Louie et al. dans Epidemiol. Infect. 
112, 1994, 449-461 et Meng et al. dans Int. J. Food Microbiol. 32, 1996 } 103-113. 
Cependant, bien que ce facteur de virulence soit etroitement associe au groupe 
des EHEC, il est egalement rencontre chez les E. coli enteropathogenes (EPEC) 
comprenant le serotype 055 :H7. 



Enfin, des sondes ont ete selectionnees sur un plasmide de 60 MDa, 
codant entre autres pour I'enterohemolysine, facteur de virulence egalement 
present chez de nombreux EHEC (Levine et al., J. Infect Dis. 156 , 1987, 175- 
182 ; Schmidt et al., Infect Immun. 63, 1995, 1055-1061). Ainsi, le brevet US 
5,475,098 vise les sequences nucleiques contenues dans I'operon de 
Tenterohemolysine, correspondant aux genes hlyA, hlyB et a la region 
intergenique hlyA-hlyB. Les sequences oligonucleotidiques revendiquees 
permettent une detection specifique des EHEC, mais I'invention ne permet pas 
de differencier E. coli 0157 :H7 des autres EHEC. Par ailleurs, le brevet US 
5.652,102, decrit une sequence nucleique situee sur un fragment de restriction 
issu du plasmide de 60 MDa. Cependant, I'utilisation d'oligonucleotides derives 
de cette sequence dans une reaction de polymerase en chaine ou "Polymerase 
Chain Reaction" (PCR), ne permet pas a elle seule r identification specifique du 
serotype 0157 :H7, et necessite par consequent I'utilisation conjointe d'amorces 
amplifiant les genes codant pour les verotoxines et Tintimine. 

Le plasmise p0157, isole d'une souche E. coli 0157:H7 provenant d'un 
echantillon clinique, a dernierement ete decrit dans sa totalite (Makino et al, DNA 
Research 5, 1998, 7-9). Une cartographie du plasmide representant 
I'ordonnancement des differents genes sur le genome du plasmide indique la 
presence de 186 phases ouvertes de lecture (ORF). Toutefois, I'absence de 
donnees de la sequence nucleique (donnees non disponibles au moment de la 
parution de Tarticle), ne permet en aucun cas d'identifier une region d'interet 
diagnostique pour la detection specifique de E. coli 0157:H7. 

Dernierement, la demande de brevet W0 97/32045 vise des 
oligonucleotides selectionnes a partir d'une sequence chromosomique obtenue 



WO 99/55908 



- 4 - 



PCT/FR99/01000 



par la methode RAPD (Random Amplified Polymorphic DNA), conduisant -a la- 
detection d'environ 99 t 5 % de E. coli 0157 :H7, mais les sequences nucleiques 
revendiquees detectent egalement pres de 3 % de E . coli non EHEC, ce qui 
n est pas satisfaisant en terme de specificite, notamment dans le domaine de 
I'agro-alimentaire. 

L 1 inconvenient majeur de tous ces systemes de detection reside done 
dans le fait qu'aucun d'entre eux, ne permet d'etablir clairement et simplement 
('identification du serotype E. coli 0157 :H7. II est en effet tres souvent 
necessaire d'associer plusieurs systemes d'amplification et/ou de detection pour 
rendre le resultat precis. Les protocoles utilises sont alors difficiles a mettre en 
oeuvre (amplifications multiples, simultanees) et les resultats obtenus quant a la 
sensibilite et a la specificite sont fortement dependants, non seulement des cibles 
nucleiques utilisees, mais aussi des conditions operatoires. 

Or, comme il a ete precedemment indique, ce serotype peut provoquer de 
graves syndromes pouvant conduire a la mort, ce qui implique des moyens 
rapides et fiables de detection, notamment en cas d J epidemie, 

Les travaux des inventeurs ont consiste a rechercher des sequences 
specifiques a partir d'une banque genomique de E. coli 0157 :H7, permettant la 
reconnaissance des principaux serotypes de E. coli pathogenes pour I'homme, et 
plus particulierement 0157 :H7. La banque a ete criblee contre E coli 
enteropathogene 055 :H7, ancetre suppose du serotype 0157 :H7, les deux 
genomes etant extremement proches d'apres les analyses de polymorphisme 
realisees par T. Whittam et aL dans Infect. Immun. 6±, 1993, 1619-1629. 

Ces travaux ont permis d'isoler deux fragments nucleiques d'interet pour la 
detection des EHEC et plus particulierement pour la detection de E coli 
0157 :H7, comprenant les sequences nucleiques SEQ ID N°1 et SEQ ID N°2. 
situees sur le plasmide enterohemolytique de 60 MDa. Les clones 
correspondants pDF3 et pDF4 contenant ces sequences ont ete deposes aupres 
de la Collection Nationale de Cultures de Microorganismes de I'lnstitut Pasteur, 
respectivement sous les numeros 1-1999 et I-2000, le 26 mars 1998. 
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D'une fa?on surprenante, il a ete mis en evidence une premiere sequence 
(SEQ ID N°1) comprenant I'association stable cTune partie de la sequence 
d'insertion \S91 et de la sequence issue du gene katP de E. coli 0157 :H7 ou 
d'une partie de celle-ci, I'enchainement nucleique en resultant, jamais decrit par 
ailleurs, etant specifiquement retrouve chez E. coli 0157 :H7. 

Le gene katP, codant pour une catalase-peroxydase, est present sur le 
plasmide enterohemolytique de E. coli 0157:H7 et de nombreuses EHEC 
(BrunderetaL, Microbiol. 142. 1996, 3305-3315), et la sequence d'insertion IS97. 
identifiee sur les plasmides a-hemolytiques de E. coli (Zabala et ai, J. Bacterid. 
151 , 1982, 472-476), n'a encore jamais ete decrite chez les souches 
enterohemolytiques de type E. coli 0157 :H7. 

La mise en evidence d'une sequence d'insertion tronquee au niveau de la 
jonction \S91-katP (absence de la sequence inversee repetee gauche (IR L ) de 
TIS97) suggere aussi une integration stable de NS97 dans cette partie du 
genome de E. coli 0157 :H7. 

L'analyse des produits amplifies d'un grand nombre de souches 0157 :H7 
d'origines diverses demontre la conservation de cet enchainement nucleotidique 
au sein du serotype 0157 ;H7. 

En effet, un produit amplifie de 670 paires de bases a ete observe chez 
toutes les souches testees (55 E. coli 0157 :H7 et 1 E . coli 0157 ;H-) avec les 
amorces SEQ ID N°3 et SEQ ID N°4, situees respectivement dans les sequences 
\S91 et katP. 

Par ailleurs, les donnees obtenues a partir des profits de restriction Alu\ et 
Rsa\ effectues sur les produits amplifies de 5 souches 0157 :H7 d'origines 
differentes, ainsi que l'analyse de sequence realisee chez 3 souches, dont 2 
isolees d'epidemies (USA, 1993 et Japon, 1996) ont montre une parfaite 
conservation c'est a dire 100 % d'homologie dans la partie de sequence analysee 
(SEQ ID N° 1 : positions (nt) 272 a 624). 
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De plus, I'encharnement nucleotidique, stable et conserve, est 
probablement un evenement de recombinaison relativement ancien, survenu 
chez E. coli 01 57 :H7 au cours de revolution, puisque des souches isolees en 
des lieux et des epoques differents presentent cette meme caracteristique. 

Cette sequence represente done une cible de choix pour la detection 
specifique du serotype 0157 :H7. 

Une seconde sequence a ete caracterisee (SEQ ID N°2) sur le meme 
plasmide, associee a la presence des facteurs de virulence enterohemolysine 
(ehly) et intimine (eae), caracteres propres aux souches de E. coli 
enterohemorragiques, comprenant le serotype 0157 :H7. A ce titre, ce fragment 
presente un interet epidemiologique, car, a la difference des procedes deja 
connus, necessitant la mise en oeuvre de plusieurs systemes moleculaires (Paton 
et Paton, J. Clin Microbiol. 36, 1998, 598-602), Tutilisation de cette sequence 
pour une application diagnostique donne lieu a une mise en oeuvre simplifiee et a 
une interpretation plus rapide des resultats. 

La presente invention a done pour objet les sequences nucleiques SEQ ID 
N°1 et SEQ ID N°2, leurs sequences complementaires, les sequences derivees 
de celles-ci et les fragments utilisables pour la detection specifique des EHEC. 
dans un echantillon alimentaire, clinique ou veterinaire, ou de Tenvironnement. 

La presente invention a plus particulierement pour objet une sequence 
specifique pour la detection du serotype E. coli 0157 :H7 t comprenant la 
sequence SEQ ID N°1, un fragment de cette sequence ou une sequence derivee 
de celle-ci. 

Selon Finvention, la sequence SEQ ID N°1 comprend un enchainement 
nucleotidique resultant d J un evenement de recombinaison stable entre la 
sequence du gene katP ou une partie de celle-ci et une sequence d'insertion 
\S91 tronquee. 
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Selon la presente invention, on entend par sequence nucleique aussi,bien 
ta sequence d'ADN ou d'ADN complementaire (ADNc), ou encore la sequence 
d'ARN correspondante. 

L'invention concerne aussi des sequences nucleiques derivees de la SEQ 
ID N°1 ou la SEQ ID N°2, c'est a dire des sequences differant par mutation, 
insertion, deletion et/ou substitution d'une ou plusieurs bases mais s'hybridant 
neanmoins, dans des conditions de forte stringence, avec Tune des susdites 
sequences. 

Selon ('invention, on entend par forte stringence des conditions de 
temperature et de force ionique telles qu'elles permettent une hybridation 
specifique entre deux fragments d'acides nucleiques complementaires et limitent 
les fixations aspecifiques (Sambrook et a/. , Molecular Cloning, Second Edition 
(1989), 9.47-9.62). Les conditions de temperature sont generalement comprises 
entre (T m moins 5°C) et (T m moins 10°C) lorsque Tune des sequences de I'hybride 
est courte (une vingtaine de nucleotides), T m etant la temperature theorique de 
fusion, definie comme etant la temperature a laquelle 50 % des brins apparies se 
separent. 

On entend egalement selon (invention, par sequence nucleique derivee de 
la SEQ ID N° 1, toute sequence differant de celle-ci par mutation, insertion, 
deletion et/ou substitution d'une ou plusieurs bases et comportant un 
enchainement de recombinaison stable entre le gene katP et la sequence 
d insertion \S91 tronquee. 

Plus particulierement, les sequences nucleiques contiennent au moins 8 
nucleotides, preferentiellement 10 nucleotides, ou tres preferentiellement 14 
nucleotides consecutifs de I'enchainement de ia Figure 1, et comprennent les 
nucleotides de la position 400 a la position 407. 



La presente invention a egalement pour objet une seconde sequence, 
specifique des EHEC, qui est la SEQ ID N°2, les sequences complementaires de 
celles-ci, les fragments de celles-ci et les sequences derivees de celles-ci, ces 
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sequences etant toujours detectees chez les EHEC, notamment chez les EHEG. 
possedant conjointement les genes codant pour renterohemolysine (ehly) et 
I'intimine (eae) ; ladite sequence SEQ ID N° 2 etant representee a la Figure 2. 

L'invention se rapporte egalement a des fragments oligonucleotidiques. 
issus des sequences SEQ ID N°1 et SEQ ID N°2, utilisables comme amorces 
dans un processus d'amplification ou comme sonde dans le cadre de la mise en 
ceuvre d'un procede de detection, comprenant au moins 8, avantageusement au 
moins 10, plus avantageusement 14 nucleotides, et de preference jusqu'a 30 
nucleotides consecutifs de I'enchainement nucleotidique de SEQ ID N°1 ou de 
SEQ ID N°2, lesdites amorces etant susceptibles de s'hybrider aux dites 
sequences dans des conditions de forte stringence, telles que definies ci-dessus. 

Les amorces ou sondes de l'invention comprennent egalement des 
oligonucleotides pouvant etre modifies par substitution et/ou addition et/ou 
suppression de plusieurs nucleotides, ou par I'addition a Tune des extremites 
(generalement en 5' pour les amorces ; 3' ou 5' pour les sondes) d'une sequence 
nucleique etrangere a la sequence recherchee, ou encore d'une molecule de 
marquage, lesdits oligonucleotides etant neanmoins capables de s'hybrider dans 
des conditions de forte stringence avec des sequences nucleiques 
complementaires presentes chez E. coti Q157 :H7 ou chez les EHEC. 



Selon un mode prefere de l'invention, les oligonucleotides peuvent etre 
utilises comme amorces, dans un processus d'amplification genique, conduisant 
a I'obtention d'une quantite importante de copies d'un fragment de SEQ ID N° 1 
ou d'un fragment de SEQ ID N° 2 et permettant respectivement, la detection 
specifique de E. coii 0157 :H7 ou des EHEC. 

L'etape d'amplification peut etre realisee par toute methode utilisant les 
techniques classiques d'amplification enzymatique de I'ADN ou de TARN, telles 
que notamment, la technique TAS (Transcription-based Amplication System) 
proposee par Kwoh et al dans PNAS, 86, 1989, 1173-1177, la technique 3SR 
(Self-Sustained Sequences Replication) decrite par Fahy et al. dans PCR Meth. 
Appl. 1 , 1991 } 25-33, la technique NASBA (Nucleic Acid Sequence-Based 
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Amplification) decrite dans le brevet EP 329 822, ou encore ta technique SDA 
(Strand Displacement Amplification) decrite par Walker et al. dans P.N.A.S, 89. 
1992, 392-396, ou avantageusement la technique PCR telle que decrite 
notamment dans les brevets Europeens, EP 200 362 et EP 201 184, delivres au 
nom de Cetus, ou encore les techniques derivees de ces dernieres et toute 
methode visant a amplifier in vitro les sequences nucleiques. 

Dans un mode de realisation prefere de I'invention, les oligonucleotides 
issus des sequences SEQ ID N°1 et SEQ ID N°2 sont utilises en PCR. 

La detection des produits amplifies peut etre realisee par electrophorese 
sur gel de tout ou partie du milieu reactionnel dans lequel I'amplification a ete 
effectuee, notamment sur gel d'agarose ou de polyacrylamide, ou par 
electrophorese capillaire ou par chromatographie. La visualisation d'une bande 
de fragments nucleiques localisee en un point specifique du gel permet d J en 
apprecier la taille, I'intensite de cette bande pouvant etre correlee grossierement 
au nombre de copies initiales de la cible a detecter dans I'echantillon. 

Seion un autre mode de realisation de ['invention, les oligonucleotides, tels 
que definis ci-dessus, peuvent etre utilises comme sondes dans un processus 
d'hybridation pour la detection directe d'une sequence nucleique cible ou apres 
amplification pour la detection des produits amplifies. 

A titre d'illustration, les fragments nucleotidiques peuvent etre marques par 
un element radioactif (par exemple 32 P, 35 S , 3 H, 125 l ) ou par une molecule non 
radioactive notamment biotine, acetylamino-fluorene, fluorochrome, digoxigenine. 
ou par une molecule enzymatique, ou un haptene. Des exemples de marquages 
non radioactifs de sondes sont decrits, par exemple, dans le brevet frangais de 
P. Kourilsky n° 78. 10975, ou par M.S. Urdea et a/., Nucleic Acids Symp. Sen, 24.. 
1991, 197-200, ou encore par R. Sanchez-Pescador, J. Clin. Microbiol. 26, 1988. 
1934-1938. 



La methode d'hybridation la plus generale consiste a immobiliser I'acide 
nucleique extrait de I'echantillon a analyser sur un support (nitro-cellulose, nylon, 
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poiystyrene, etc. ) et a incuber dans des conditions definies de temperature et de 
force ionique, I'acide nucteique immobilise avec la sonde. Apres hybridation, 
I'exces de sonde est elimine et les molecules hybrides formees sont detectees 
par la methode appropriee (mesure de la radioactivite, de fa fluorescence ou de 
5 Tactivite enzymatique liee a la sonde). 

Les molecules hybrides formees peuvent egalement etre detectees sans 
qu'il soit necessaire de separer les phases « liee » et « non liee ». On dit alors 
que la detection s'effectue en phase homogene. Ces methodes, telles que 

io decrites par T. Walker ef aL Clin. Chemistry 42, 1996, 9-13 et L. Morrison 
(Nonisotopic DNA Probe Techniques, Academic Press, 1992, 312-352) 
concernent notamment la polarisation de fluorescence, dans laquelle une sonde 
est marquee a la fluoresceine et ou ('hybridation entraine une modification de la 
fluorescence, ou encore le transfer! d'energie. Dans ce dernier cas, la detection 

15 repose sur des interactions inter ou intramoleculaires entre deux marqueurs. Un 
premier marqueur appele « donneur » est excite par absorption d'une lumiere a 
une longueur d'onde particuliere. L'energie est transferee a un second marqueur 
appele « accepteur », qui est a son tour excite et emet de l'energie. 

2o Les sondes oligonucleotidiques peuvent egalement etre mises en ceuvre 

au sein d'un dispositif de detection comprenant un arrangement matriciel 
d'oligonucleotides dans lequel, des oligonucleotides d'une longueur donnee, sont 
fixes dans un ordre predetermine sur un support et se chevauchent les uns par 
rapport aux autres d'une ou plusieurs bases ; chaque oligonucleotide etant 

25 complementaire d'une sequence d'ADN ou d'ARN de la sequence cible a 
detecter. La sequence cible, avantageusement marquee est mise en contact - 
avec le dispositif matriciel et peut s'hybrider aux sondes fixees sur le support. Un 
traitement enzymatique permet ensuite d'eliminer les hybrides incomplets. 
Connaissant la sequence d'une sonde a une position determinee de la matrice, il 

3<) est ainsi possible de deduire la sequence nucleotidique de la sequence cible 
analysee et de deduire les mutations eventuellement survenues. 

Une alternative a I'utilisation d'une sequence marquee peut consister en 
I'utilisation d'un support permettant une detection « bioelectronique » de 
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I'hybridation de la sequence cible sur les sondes fixees sur le support d'un 
materiau, tel que Tor, capable d'agir, par exemple, en tant que donneur 
d'eiectrons aux positions de la matrice auxquelles un hybride est forme. La 
detection de la sequence nucleique cible est alors determinee par un dispositif 
electronique. Un exemple de realisation d'un biocapteur est decrit dans la 
demande de brevet EP-0721 016 au nom d'Affymax Technologies. 



Selon un mode simple et avantageux de mise en ceuvre, les sondes 
nucleiques peuvent etre utiiisees comme sondes de capture. Dans ce cas. la 
sonde dite « sonde de capture » est immobilisee sur un support et sert a capturer 
par hybridation specifique Tacide nucleique cible a partir de I'echantillon a tester. 
Si necessaire, le support solide est separe de I'echantillon et le duplex forme 
entre la sonde de capture et la sequence d'acide nucleique cible est ensuite 
detect e grace a une seconde sonde dite « sonde de detection », marquee par un 
element detectable. Avantageusement, les sondes de capture et de detection 
sont complementaires de deux regions differentes comprises dans la sequence 
cible (amplifiee ou non ) a detecter. 

La fixation de la sonde de capture sur le support solide peut se faire selon 
des procedes bien connus de I'homme du metier, notamment par adsorption 
passive ou par couplage covalent (Cook et aL, Nucleic Acids Res. 16, 1988, 
4077-4095 ; Negate eteL, FEBS Lett 183, 1985, 379-382 ; M. Longlaru et aL, EP 
420 260 A2 ; T. Gingeres et aL, EP 276 302 ; E. Homes et LM. Kornes, EP 446 
260). 

L'hybridation des sondes de capture et de detection peut se faire 
separement (en deux temps) ou simultanement (en un temps), notamment selon 
Tune des methodes decrites par Langhale et Malcolm, Gene 36, 1985, 201-210 
ou par Ranki etal, Gene 2±, 1993, 77-85, par Dunn et Hassel, Cell, 12, 1977, 23- 
36 ou encore par Ranki et Soderlund dans les brevets US 4,486.539 et 
US 4,563,419. 

La presente demande a done egalement pour objet des oligonucleotides, 
issus de SEQ ID N°1 ou de SEQ ID N°2, selectionnes comme amorces ou 
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comme sondes, susceptibles de s'hybrider dans des conditions stringentes aveG 
une sequence d'acide nucleique cible contenue dans I'echantillon teste, 
specifiques de E. coll 0157 :H7 ou des.EHEC. 



On entend par sequence nucleique cible, toute molecule d'ADN ou ADNc 
ou d'ARN capable de s'hybrider dans des conditions de forte stringence avec un 
oligonucleotide selon i'invention. 



Les oligonucleotides preferes dont les sequences sont specifiees en 
annexe correspondent aux positions sur ies sequences SEQ ID N° 1 et 
SEQ ID N° 2 rapportees dans le tableau ci-apres : 

Position dans 

Sequence SEQ ID N°1 



SEQ ID N°3 : 


9-30 


SEQ ID N°4 : 


679 - 658 


SEQ ID N°5: 


6 - 30 


SEQ ID N°6 : 


682 - 658 


SEQ ID N°7 : 


241 - 263 


SEQ ID N°8 : 


47-69 


SEQ ID N°9 : 


251 - 274 


SEQ ID N°10 : 


426-401 


SEQ ID N°11 : 


427 - 402 


SEQ ID N°12 : 


391 -421 


SEQ ID N°13 : 


387 - 41 7 


SEQ ID N°14 : 


291 -321 


SEQ ID N°15 : 


51 0 - 540 


SEQ ID N°16 : 


331 - 350 


SEQ ID N°17 : 


68-87 


SEQ ID N°18 : 


397 -410 


SEQ ID N°19 : 


396 - 41 1 


SEQ ID N°20 . 


395-412 
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SEQ ID N°-2 



SEQ ID N°21 
SEQ ID N°22 
SEQ ID N°23 
SEQ ID N°24 
SEQ ID N°25 
SEQ ID N°26 
SEQ ID N°27 



718 - 739 
1099 - 1078 
41 - 60 

884 - 863 

928 - 958 
970 - 1000 

883 - 903 



L' invention concerne aussi des couples ^oligonucleotides, tels 
que decrits precedemment, susceptibles d'etre utilises comme amorces pour 
('amplification d'une sequence nucleique cible correspondant a SEQ ID N°1 ou 
SEQ ID N°2, contenue dans le genome de E. coli 0157 :H7 ou des EHEC : 

Les couples d'amorces preferees sont les suivants : 

• pour I'amplification de E. coli 0157 :H7 

- SEQ ID N° 3 et SEQ ID N° 4 

- SEQ ID N° 5 et SEQ ID N° 6 

- SEQ ID N° 6 et SEQ ID N° 7 

- SEQ ID N° 6 et SEQ ID N° 8 

- SEQ ID N° 6 et SEQ ID N° 9 

• pour I'amplification des EHEC : 

- SEQ ID N° 21 et SEQ ID N° 22 
- SEQ ID N" 23 et SEQ ID N° 24 

Ainsi, I'utilisation du couple d'amorces SEQ ID N°5 et SEQ ID N°6 pour 
realiser I'amplification de I'acide nucleique de E. coli 0157:H7 conduit a 
I'amplification d'un fragment nucleique de 676 pb, caracteristique des souches de 
E. coli 0157:H7. La specificite de ce fragment peut etre eventuellement 
controlee par I'utilisation de la sonde SEQ ID N° 18. 



De meme, I'utilisation du couple d'amorces SEQ ID N° 21 et 
SEQ ID N° 22 amplifie specifiquement une sequence nucleique de 382 pb. 
presente chez les EHEC, possedant aussi les caracteres enterohemolysine et 
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intimine. Les bacteries appartenant aux autres groupes de E. co/i, comme tea 
ETEC (E . coli producteurs d'enterotoxines), les EPEC etc, ne sont pas 
detectees. La specificite du produit amplifie peut etre par ailleurs confirmee a 
Taide de sondes oligonucleotidiques internes au fragment amplifie, telles que 
5 SEQ ID N°27. 

La presente invention a egalement pour objet des oligonucleotides, tels 
que precedemment decrits, susceptibles d'etre utilises comme sondes pour la 
detection d'une sequence de nucleotides, eventuellement amplifiee. Par 
io exemple, les sequences oligonucleotidiques SEQ ID N° 14, SEQ ID N°15 et SEQ 
ID N° 18 peuvent etre utilisees pour la detection specifique de E. coli 0157 :H7. 
De meme, I'utilisation des sequences SEQ ID N° 25, SEQ ID N° 26 et SEQ ID N° 
27 permet la detection des EHEC dont 0157:H7. 

1 5 L'invention a egalement pour objet les plasmides contenant les sequences 

SEQ ID N° 1 et SEQ ID N° 2 mentionnees precedemment ainsi que les cellules 
hotes les contenant 

L'invention vise aussi un procede pour la detection in vitro de E. coli 
0157 :H7 ou des EHEC dans un echantillon, caracterise en ce qu'il comprend les 
2o etapes suivantes ; 

1. la mise en contact de I'echantillon avec Tun des couples d'amorces, tels 
que decrits ci-dessus, I'acide nucleique contenu dans I'echantillon ayant ete, ie 
cas echeant, rendu accessible a Thybridation des amorces a I'acide nucleique de 
la cible recherchee, 

2* 2. Tamplification de la sequence nucleique encadree par le couple 

d'amorces choisi, 

3. la verification de la presence eventuelle du produit amplifie pouvant 
s'effectuer selon une methode connue de Thomme du metier, telle que 
precedemment decrite. 

50 

Selon un mode de realisation avantageux, les fragments amplifies peuvent 
etre detectes selon le principe de la methode dite « sandwich ». 
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Entre egalement dans le cadre de Tinvention, un procede pour la detection 
in vitro de sequences nucleotidiques specif iques de E. coli 0157 :H7 ou des 
EHEC, prealablement amplifiees par detection sur un support, par exemple une 
plaque de micro-titration et, caracterise en ce qu'il comprend les etapes 
5 suivantes : 

- denaturation de la sequence amplifiee de E. coli 0157 :H7 et/ou des 
EHEC par un moyen physique ou chimique. On preferera I'addition d'une solution 
denaturante composee de 200 mM NaOH, 40 mM EDTA, 

- mise en contact, dans un tampon d'hybridation approprie des fragments 
in amplifies denatures avec, d'une part au moins une sonde de capture fixee sur le 

support, et d'autre part, au moins une sonde nucleique de detection libre dans le 
tampon d'hybridation, eventuellement marquee, susceptible de s'hybrider avec le 
meme brin des fragments amplifies que celui avec lequel la sonde de capture est 
hybridee, mais en une region distincte de celle hybridee avec la sonde de 
1 5 capture ; ladite solution d'hybridation pouvant etre avantageusement SSPE 
(Sodium Saline Phosphate EDTA ; Molecular Cloning, A practical guide, 
Sambrook et aL, Vol.3 . 1989, annexe B13) 5 fois concentre, 0,5% Tween 20, 
Merthiolate 0,01 % , 

- incubation du melange reactionnel pendant une periode suffisamment 
2o longue pour permettre Thybridation ; cette incubation pouvant etre, par exemple, 

avantageusement accomplie a 37°C pendant environ 1 heure, 

- un ou plusieurs lavage(s) du melange precedent, afin d'eliminer toute 
sequence nucleique n'ayant pas reagi ; lesdits lavages pouvant etre par exemple 
effectues avec une solution contenant du Tris-HCI 10 mM, NaCI 300 mM et 

25 Tween 20 0,1%, pH 7,4. 

- revelation des sondes de detection hybridees aux sequences nucleiques 
amplifiees. 

Selon un mode avantageux de I'invention, la sonde de detection est 
M) marquee a la peroxydase, et la revelation de Tactivite de la peroxydase liee a la 
sonde de detection hybridee est realisee par lecture colorimetrique, en presence 
d'un substrat chromogene, selon les etapes suivantes : 

-depot d'une solution contenant un substrat chromogene, tel que le 
tetramethylbenzidine (TMB ) ( dans chacun des puits contenant le melange de la 
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reaction, et incubation a I'obscurite de la microplaque pendant un temps suffisant. 
generalement 20 a 30 min., puis la reaction est arretee par I'addition d'une 
solution d'arret, ladite solution etant avantageusement une solution de H 2 S0 4 
utilisee a une concentration finale de 0.5 N, 

- determination de la densite optique, ladite determination etant realisee a 
une longueur d'onde de 450 nm (reference 620 nm) lorsque le TMB est utilise 
comme substrat chromogene. 

Selon un mode de realisation particulierement avantageux, la sonde de 
capture utilisee pour la detection de E. coli 0157 :H7 peut etre SEQ ID N°15 et la 
sonde de detection est ('oligonucleotide SEQ ID N°18. De meme, la sonde de 
capture utilisee pour la detection des bacteries EHEC peut etre SEQ ID N°25 et 
la sonde de detection ['oligonucleotide SEQ ID N°27. 

L'invention concerne egalement une trousse de detection, pour 
I'identification de E. coli 0157 :H7 ou des EHEC, contenus dans un echantillon, 
comprenant parmi les reactifs : 

- au moins deux oligonucleotides tels que definis precedemment, utilises 
comme amorces pour ('amplification de E. coli 0157 :H7 ou des bacteries du 
groupe EHEC, 

- eventuellement, un composant pour verifier la sequence du fragment 
amplifie, plus particulierement, une sonde nucleique telle que definie 
precedemment. 

Les exemples suivants sont donnes a titre non limitatif pour illustrer l'invention. 
EXEMPLE 1 

Caracterisation des sequences SEQ ID N°1 et SEQ ID N°2 

1 ) Construction de la banque genomique de E. coli 0157 :H7 : 
L'ADN genomique de la souche E. coli 0157 :H7 isolee des selles d'un 
patient atteint de colite hemorragique et productrice des verotoxines de type 1 et 
2 a ete digere partiellement par I'endonuclease Pstl (Boehringer Mannheim ; Ref. 
621625) en faisant agir 0.03 unite d'enzyme par pg d'ADN en milieu tamponne 
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pendant 1 heure a 37°C. L'ADN genomique ainsi digere a permis de generer des 
fragments de 35-45 kb. Le cosmide pHC79 (Hohn et Murray, Proc. Natl. Acad. 
Sci 74, 1977, 3259-3263) a ete digere de la meme maniere et dephosphorile pour 
eviter toute autoligation. 

La ligation s'est effectuee en melangeant 900 ng de vecteur et 2.6 pg de 
fragments d'ADN de 35-45 kb (soit un rapport molaire vecteur/insert de 2), le 
milieu reactionnel etant laisse a 14°C pendant 18 heures apres avoir ete 
additionne de 2 unites de T4 DNA ligase (Boehringer Mannheim ; Ref 481220). 
Les cosmides recombinants ont ete encapsides in vitro et utilises pour 
transformer les bacteries E. coli XL1-Blue MR (Stra agene ; Ref. 200300). Les 
bacteries transformees ont ete incubees 1 heure a 37°C en milieu LB (Luria- 
Bertani, Molecular Cloning, A practical guide, Sam brook et ai, Vol. 3 , 1989, 
annexe A1). Les fragments d'ADN de 35-45 kb etant inseres dans le vecteur 
pHC79 de maniere a abolir le site de resistance ampicilline et preserver le site de 
resistance tetracycline, les bacteries ont ete ensuite etalees sur milieu selectif 
gelose contenant 12.5 jjg/ml de tetracycline. 

Des mini-preparations d'ADN cosmidique ont ete effectuees a partir des 
360 premieres colonies isolees sur tetracycline en utiiisant le Kit REAL Prep96 
distribue par Quiagen (Ref. 26171). 

L'ADN de ces preparations a ete ensuite digere par les endonucleases 
Pstl, EcoRI et Sail (Boehringer Mannheim, Ref 621625, 703737 et 567663), 
analyse en electrophorese sur gel d'agarose a 1.2 % puis transfere sur filtre de 
nylon Hybond N + (Amersham, Ref RPN 303B). L'ADN a ete fixe de fa?on 
irreversible par 5 mn d'exposition aux UV. 

2) Criblage de la banque : 

Les hybridations ont ete realisees avec une sonde d'ADN homologue 
provenant de la souche E. coli 0157 :H7 (Collection de I'lnstitut Pasteur, n° 
103571) et avec une sonde d'ADN heterologue constitute d'un « pool » d'ADN 
provenant de 8 souches E. coli 055 :H7 (Collection de I'lnstitut Pasteur, n° 
105215, 105216, 105217, 105228, 105239, 105240, 105241, 105242). 
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Les differents filtres ont ete hybrides pendant 16 a 18 heures a 65 C C dans 
une solution contenant du tampon SSC (Sodium Saline Citrate ; Molecular 
Cloning, A practical guide, Sambrook et ai, Vol. 3, 1989, annexe B13) 6 fois 
concentre, de la solution de Denhart 5 fois concentree (Molecular Cloning, Vol. 3 , 
1989, annexe B15), 10 % de sulfate dextran (Pharmacia Biotech, Ref 17-0340- 
02), 10 mM EDTA, 0.5 % SDS, 100 |jg/ml ADN simple brin de sperme de 
saumon et l J ADN relevant (0157 :H7). 

Apres hybridation, les filtres ont ete laves 2 fois 10 mn dans un tampon 
SSC 2 fois concentre a 65°C, 1 fois 30 mn dans un tampon contenant du SSC 2 
fois concentre et 0.1 % SDS a 65°C puis 1 fois 10 mn dans du SSC dilue au 
1/1 Oe a 65°C. Les filtres encore humides ont ete exposes en cassette avec un 
ecran intensifiant pendant 24 a 48 heures a -80°C. 

Apres te temps d'exposition necessaire, les films ont ete developpes puis 
les membranes de nylon deshybridees en effectuant 4 a 5 cycles de bains a 45°C 
sous agitation. Pour chaque cycle, 2 bains successifs de 30 mn dans une 
solution de NaOH 0.5 N puis 30 mn dans un tampon contenant du SSC dilue au 
1/1 Oe et SDS 0.1 % ont ete effectues. Les membranes ont finalement ete lavees 
en SSC 2 fois concentre et mises en cassette pour verifier qu'il ne reste plus de 
traces d'hybridation. Apres deshybridation, les filtres ont ete hybrides de la meme 
maniere que precedemment avec un pool d'ADN non relevant (055 :H7). 

3) Isolement et clonage des fragments SEQ ID N°1 et SEQ ID N°2 : 
Les resultats de ces hybridations ont permis d'identifier deux clones 
cosmidiques a partir desquels un fragment d'environ 1 a 2 kb, hybridant avec la 
sonde homologue et n'hybridant pas avec la sonde heterologue, a ete isole 
respectivement. Apres avoir verifie leur conservation chez differentes souches 
0157 :H7 par hybridation en « dot-blot », ces fragments ont ete clones dans un 
vecteur pUC18 (Oncor Appligene, Ref. 161131) puis prepares en grande 
quantite. Les plasmides recombinants ont ete denommes pDF3 et pDF4 et 
correspondent respectivement aux sequences SEQ ID N°1 et SEQ ID N°2. 
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4) Determination des sequences SEQ ID N°1 et SEQ ID N°2 
Les fragments ont ete sequences seton la methode de Sanger et al. 
decrite dans Proc. Natl. Acad. ScL 74, 1977, 5463, en utilisant le « primer 
universe! » et le « reverse primer » du plasmide pUC18, ainsi que des 
oligonucleotides internes aux sequences. 

La sequence SEQ ID N°1 (Figure 1), contenant 1489 pb, presente une 
homologie de 99,9 % avec le gene katP de E. coli 0157 :H7 dans la region 407 a 
1489 et une homologie de 95,8 % avec V\S91 de E. co// dans la region 1 a 406. 

L'analyse de la sequence SEQ ID N°2 (Figure 2), contenant 1181 pb, ne 
revele aucune sequence connue du plasmide enterohemolytique. Seule la partie 
237 a 570 presente une homologie de 68 % avec le gene plasmidique w/K. 
codant pour une proteine de virulence de Shigella flexneri. 



EXEMPLE 2 

Detection specifique de E. coli Q157 :H7 

L'etude de specificite a ete effectuee sur 100 souches de E. coli de 
serotypes differents et 42 souches non E coli comprenant, entre autres, des 
bacteries susceptibles de presenter des reactions croisees avec E coli 0157 :H7 
comme par exemple Salmonella, Shigella dysenteriae, Citrobacter freundii, 
Hafnia alvei, Escherichia hermanii. 

1 ) Extraction de I'ADN : 

On obtient les sequences d'ADN par la methode d'ebullition en presence 
de Chelex (InstaGene™ Matrix, Biorad). Les echantillons ont ete prepares selon 
le protocole suivant : 
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Une suspension bacterienne est effectuee dans de I'eau ultra pure sterile 
a partir de plusieurs colonies bacteriennes isolees sur gelose Tryptone-Caseine- 
Soja (Sanofi Diagnostics Pasteur, Ref. 53455), puis centrifugee a 10000-12000 
tours / min pendant 2-3 min et le surnageant soigneusement elimine. Le culot 
bacterien est resuspendu dans 200 pi de reactif de lyse, homogeneise puis 
incube dans un bloc chauffant a 100°C pendant 10-15 min. L'echantillon est de 
nouveau homogeneise, puis centrifuge a 10000-12000 tours / min pendant 2-3 
min. L'ADN peut etre amplifie directement ou stocke a -20°C. 

2) Amplification par PGR : 

La reaction d'amplification est realisee dans un volume total de 50 pi 
contenant 50 mM KCI; 10 mM Tris-HCI pH 8,3; 0,01 % gelatine; 3 mM MgCI 2 ; 
0,25 pM de chaque amorce SEQ ID N°5 et SEQ ID N°6 ; 100 pM (dATP, dCTP, 
dGTP) ; 400 pM dUTP ; 0,5 unite d'Uracyl-DNA-Glycosylase (UDG ; BRL Life 
Technologies) ; 1 unite de Taq DNA Polymerase (BRL Life Technologies) et 5 pi 
d'ADN prepare comme indique dans le paragraphe 1 . 

Apres une incubation a 50°C pendant 2 min puis a 95°C pendant 5 min, 
les echantillons sont soumis a 35 cycles d'amplification composes de 15 sec a 
95°C, 15 sec a 65 °C et 15 sec a 72°C. Les tubes sont maintenus a 72°C 
jusqu'au retrait du plateau. 

Les cycles thermiques sont realises dans un thermocycleur « Perkin-Elmer 
9600 ». 

Chaque experience comprend un controle positif et un controle negatif. 

3) Visualisation des produits amplifies : 

Les reactions d'amplification sont visualisees sur gel d'agarose ou 
detectees sur microplaque. 

3-1 ) Gel d'agarose : 

Apres amplification, 50 pi de chloroforme sont ajoutes a chaque 
echantillon afin d'inactiver rUDG puis une aliquote de chaque reaction est 
analysee par electrophorese sur gel d'agarose a 1,2 % colore au bromure 
d'ethidium ? en presence d'un marqueur de taille. La visualisation d'un fragment 
d'ADN a 676 pb indique la presence de £ coli Q157 :H7 dans I'echantillon teste. 
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3-2) Hybridation en microplaque : 

Les produits d'amplification sont denatures par addition volume a volume 
d'une solution contenant 200 mM NaOH, 40 mM EDTA. La microplaque dont la 
surface des puits est revetue de la sonde de capture SEQ ID N°15 est 
prehybridee dans un tampon d'hybridation contenant du SSPE 5 fois concentre, 
0,5 % Tween 20 et 0,01 % Merthiolate. Puis la microplaque est videe et chacune 
des cupules regoit 200 pi de tampon d'hybridation contenant le fragment amplifie 
denature et la sonde de revelation SEQ ID N°18. Uincubation est effectuee a 
37°C sous agitation pendant 1 heure. 

Les cupules sont ensuite lavees six fois avec 400 pi de solution (10 mM 
Tris-HCI pH 7,4; 300 mM NaCI et 0,1% Tween 20), puis I'activite de la 
peroxydase liee a la sonde est detectee en ajoutant dans chaque cupule 200 pi 
d'une solution de detection contenant le chromogene tetramethylbenzidine 
(TMB). La microplaque est incubee a 37°C dans Tobscurite pendant 30 min puis 
100 pi d'une solution de 1,5 N H 2 S0 4 sont ajoutes pour bloquer les reactions. Les 
densites optiques sont determinees a 450 nm contre une reference a 620 nm. 

4) Etude de la specificite : 

Les tests ont ete effectues sur un total de 142 souches bacteriennes. 
utilisant le couple d'amorces SEQ ID N°5 et SEQ ID N°6 pour I'etape 
d'amplification par PCR, la sonde de capture SEQ ID N°15 et la sonde de 
detection SEQ ID N°18 pour I'etape d'hybridation sur microplaque. 

Les resultats obtenus sur microplaque avec les souches E. coli et non 
E. coli (bacteries de genres et especes differents) sont presentes respectivement 
dans les Tableaux I et II ci-dessous : 
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Tableau I 



Souche E. coli 


Nombre de 


PCR SEQ ID N° 


(serotype) 


souches 


5/6 




testees 




VTEC/EHEC 






0157:H7 


55 


+ 


0157:H- 


1 


4* 


026:H1 1. 


10 




0111:H- 


2 


- 


0145:H- 


2 


- 


O103H2 


2 




0121H19 


t 




0165 H25 


1 
1 




045: H2 






022: H8 


2 




0137H41 






091 :H21 


1 
1 




0141:H4 






EPEC 






055:H7 


8 




055 H6 


1 




055: H- 


1 
i 




0111:H- 


1 


- 


0111:H2 


1 


- 


01 1 1:H12 


i 




0128:H2 


i 
i 




0127:H6 


1 


- 


ETEC 






0157:H19 


1 




0159:H34 


1 




CIP 81.86 


1 




E. coli 






CIP 76.24 


1 




CIP 54.8 


1 





Les resultats (+) correspondent a DO4S0 > 2,5. 
Les resultats (-) correspondent a DO450 < 0,05. 
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Tableau II 



Souche 


Nombre de 


PCR SEQ ID 


(espece bacterienne) 


souches 


N° 5/6 




testees 




Salmonella 






Salmonella (groupes 1 a VI) 


10 


- 


Shigella 






Shigella flexneri 


2 


- 


Shigella dysenteriae 


1 


- 


Shigella sonnei 


1 


- 


Autres 






Escherichia hermanii 


2 


- 


Citrobacter freundii 


2 


- 


Yersinia enterocolitica 


2 


- 


Yersinia pseudotuberculosis 


1 


- 


Hafnia alvei 


1 


- 


Proteus mirabilis 


1 


- 


Proteus vulgaris 


1 


- 


Serratia marcescens 


1 


- 


Klebsiella pneumoniae 




- 


Klebsiella oxytoca 


1 


- 


Enterobacter cloacae 


1 


- 


Enterobacter aerogenes 


1 


- 


Enterobacter agglomerans 


1 


- 


Bacillus subtilis 






Morganella morganii 


] 




Providencia alcalifaciens 






Vibrio parahaemolyticus 






Acinetobacter baumanii 






Shewanella putrefaciens 






Pseudomonas aeruginosa 






Pseudomonas fluorescens 






Listeria monocytogenes 


3 





Les resultats (+) correspondent a DO450 > 2,5. 
Les resultats (-) correspondent a DO450 < 0,05. 



En conclusion, seules les souches 0157 :H7 et 0157 :H- sont detectees 
sur microplaque avec le systeme susmentionne. 
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EXEMPLE 3 

Detection specifiaue cles EHEC 

La specif icite a ete testee sur un total de 142 souches bacteriennes 
incluant differents serotypes de E. colt ainsi que d'autres especes bacteriennes 
pouvant interferer avec la detection des EHEC. 

Les ADN ont ete extraits selon le protocole decrit dans le premier paragraphe de 
I'exemple 2. 

Les conditions d'amplification sont tes suivantes : 
La reaction est realisee dans un volume total de 50 pi contenant 50 mM KCI; 10 
mM Tris-HCI pH 8,3 ; 1,5 mM MgCI 2 ; 0,5 pM de chaque amorce SEQ ID N°21 et 
SEQ ID N°22 ; 200 pM (dATP, dCTP, dGTP, dTTP) ; 1 unite de Taq DNA 
Polymerase (BRL Life Technologies) et 5 pi d'ADN prepare comme indique dans 
le paragraphe 1 de I'exemple 2. 

Les cycles thermiques sont realises dans un thermocycleur « Perkin-Elmer 
9600 ». 

Chaque experience comprend un controle positif et un controle negatif. 

Les produits d'amplification ont ete visualises sur gel d'agarose colore au 
BET, ia presence d'une bande a 382 pb temoignant de la presence d'EHEC dans 
I'echantillon teste. 

Les resultats sont presentes dans le Tableau III. 

Seules les souches presentant les caracteres ehly et eae, facteurs de 
virulence frequemment associes chez les souches isolees dlnfections humaines, 
sont detectees par PCR avec le couple d'amorces SEQ ID N°21 et SEQ ID N°22. 

De plus, ('utilisation dudit couple d'amorces permet egalement de detecter 
en particulier, grace a une reaction d'amplification unique, les souches de E. coii 
possedant le genotype (vt\ eae + et eh!y+), caracteristique des E. coli 
enterohemorragiques. 
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Tableau III 



Souche 
(serotype) 


Nombre de 
souches 
testees 


Genotype 


PCR SEQ 
ID N°21/22 


VTEC/EHEC 












0157:H7 


54 


vt+ , 


ehly+ 


eae+ 


+ 






vt- . 


ehly+ , 


eae+ 


+ 


0157:H- 


1 


vt+ , 


ehly+ 


eae+ 


+ 


026:H11 




vt+ , 


ehly+ 


eae+ 


+ 




1 


vt- , 


ehly+ , 


eae+ 




026:H- 


\ 


vt+ , 


ehiy+ 


eae+ 


+ 


0111:H- 




vt+ - 


ehiy+ 


eae+ 


+ 


0145:H- 




vt+ , 


ehlv+ 


eae+ 

w w w 


+ 


O103:H2 




vt+ , 


ehly+ 


eae+ 


+ 


0121:H19 


\ 


vt+ ', 


ehly+ 


eae+ 


+ 


0165:H25 




vt+ , 


ehly+ 


eae+ 




045: H2 




vt+ 


ehly-t- 


030+ 


+ 


022: H8 


2 


vt+ 


, ehly+ 


T eae- 


- 


0137H41 




vt+ 


, ehly+ 


, eae- 




091:H21 


1 


vt+ 


. ehlv+ 


, eae- 




026:H11 


3 


vt+ 


ehlv- 


eae+ 




0111:H- 




vt+ 


ehly- , 


eae+ 




0141:H4 


1 


vt+ 


, ehly- 


, eae- 




EPEC 












055:H7 


8 


vt- 


ehly- , 


eae+ 


- 


055: H6 


1 


vt- 


, ehlv- 


eae- 


- 


055H- 




vt- 


, ehly- , 


eae- 




0111:H- 


1 


vt- 


, ehly- , 


eae- 




0111:H2 


1 


vt- 

V I 


ehlv- 


030+ 




0111:H12 


1 


vt- 


, ehly- , 


eae- 


- 


0128:H2 


\ 


vt- 


ehly- , 


eae+ 


- 


0127:H6 




vt- 


ehly- , 


eae+ 




ETEC 












0157:H19 




vt- 


, ehly- , 


eae- 




0159:H34 




vt- 


, ehly- , 


eae- 


- 


CIP 81.86 




vt- 


, ehly- , 


eae- 




E. coli 












CIP 76.24 




vt- 


, ehly- , 


eae- 




CIP 54.8 




vt- 


. ehly- , 


eae- 




Non E. coli 


42 
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REVINDICATIONS 

1. Sequence nucleotidique isolee comprenant la sequence nucleique SEQ 
ID N°1 ou la sequence nucleique SEQ ID N°2, leurs sequences 
complementaires, les fragments et sequences derivees de celles-ci, differant par 
mutation, insertion, deletion et/ou substitution d'une ou plusieurs bases et 
s'hybridant dans des conditions de forte stringence avec les sequences SEQ ID 
N°1 et SEQ ID N°2, respectivement. 



2. Sequence nucleotidique isolee comprenant la sequence SEQ ID N°1, les 
sequences complementaires de celles-ci et les sequences derivees de celle-ci, 
comprenant un enchainement nucleotidique resultant de I'association stable d'au 
moins une partie de la sequence d'insertion /S91 et au moins une partie de la 
sequence du gene katP. 



3. Sequence nucleotidique isolee selon la revendication 2, comprenant au 
moins 8, avantageusement 10, de preference 14 nucleotides consecutifs de 
I* enchainement de la sequence SEQ ID N°1, incluant les nucleotides de la 
position 400 a 407. 



4. Sequence nucleotidique isolee comprenant au moins 8 nucleotides 
consecutifs de la sequence SEQ ID N°1 ou de la sequence SEQ ID N°2, ou de 
sequences complementaires et derivees de celles-ci, telles que definies a la 
revendication 1. 



5. Sequence nucleotidique isolee selon la revendication 4 , choisi 

les sequences nucleiques suivantes : 

SEQ ID N°3 : 5' - C GG AG ATGAAAG C AC C ACTGTG - 3' 

SEQ ID N°4 : 5' - GGGCTGTGTAATCTCAGAGGAG - 3' 

SEQ ID N°5: 5' - GTCCGG AG ATGAAAG CACC ACTGTG - 3' 

SEQ ID N°6 : 5' - TC AGGG CTGTGTAATCTC AGAG GAG - 3' 

SEQ ID N°7 : 5' - GGCGCTGATACCGGCAAGAATGG - 3' 
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SEQ ID N°8 : 5' - GGTCCCGCAGGCCATGATTTTTG - 3' 

SEQ ID N°9 : 5' - C C G G CAAG AATG GTC G C AAACTCC - 3' 

SEQ ID N°10 :5' - AAGG GGTTC C AAG CC G C AACTG AC G A - 3' 

SEQ ID N°1 1:5'- TAAGGGGTTCCAAGCCGCAACTGACG - 3' 

SEQ ID N°12 :5' - CTC AAC GGC ATC GTC AGTTG C GGCTTG G AAC - 3' 

SEQ ID N°13 :5' - AGCACTCAACGGCATCGTCAGTTGCGGCTTG - 3' 

SEQ ID N°14 .5' - CTATTTCAGGATACCCTTCGTCATCAACACG - 3' 

SEQ ID N°15 :5' - AATTTCCCTTAATCCGGAGCTATTCGTATGA - 3' 

SEQ ID N°16 :5' - GAAGACCAGCTTTTTGTTTC - 3' 

SEQ ID N°17 :5' - TGTCACAGACTCAATGACTA - 3' 

SEQ ID N°18 .5' - GGCATCGTCAGTTG - 3' 

SEQ ID N°19 :5' - CGGCATCGTCAGTTGC - 3' 

SEQ ID N°20 :5' - ACGGCATCGTCAGTTGCG - 3' 

SEQ ID N°21 :5' - CCACCTGAACGATAAGCGGAAC - 3' 

SEQ ID N°22 :5' - CACCTTCCTTCCATCCTCAGAC - 3' 

SEQ ID N°23 :5' - ATCCCAGCGCGCTCCAGCTG - 3' 

SEQ ID N°24 .5' - ACCCATGATGGCGCATCTGATG - 3' 

SEQ ID N°25 :5' - ACGTTCTGGTCTTACGGGTGATGTAGGTTTT - 3' 

SEQ ID N°26 :5' - TAGTG AAG C G GTG AC AG C AT ATC AG AC G G CT - 3' 

SEQ ID N°27 :5' - GTGAGATAGGCACAACAATGA - 3' 

6. Couples de sequences nucleotidiques isolees selon les revendications 4 
ou 5, utilises comme amorces, choisis parmi des couples suivants de sequences 
suivantes : 

- SEQ ID N° 3 et SEQ ID N° 4 

- SEQ ID N° 5 et SEQ ID N° 6 

- SEQ ID N° 6 et SEQ ID NT 7 

- SEQ ID N° 6 et SEQ ID N° 8 

- SEQ ID N° 6 et SEQ ID N° 9 

- SEQ ID N° 21 et SEQ ID N° 22 

- SEQ ID N° 23 et SEQ ID N° 24 



WO 99/55908 PCT/FR99/01000 

- 28- 

7. Sequence nucleotidique isolee selon la revendication 4 ou 5, utilisee 
comme sonde, choisie parmi les sequences suivantes : 

SEQ ID N°14 , SEQ ID N°25, SEQ ID N°15 , SEQ ID N°26, SEQ ID N°18 , et 
SEQIDN°27 



8. Sequence nucleotidique isolee selon la revendication 7, caracterisee en 
ce qu'elle est marquee. 

9. Sequence nucleotidique isolee selon la revendication 7, caracterisee en 
ce qu'elle est immobilisee sur un support. 

10. Plasmides pDF3 et pDF4 deposes a la Collection Nationale de Cultures 
de Microorganismes respectivement sous les numeros 1-1999 et I-2000, le 26 
mars 1998. 

1 1 Cellule hote comprenant un plasmide selon la revendication 1 0. 

12. Procede de detection de E . coli 0157 :H7 ou des EHEC dans un 
echantillon, comprenant les etapes suivantes : 

(a) mise en contact de I'echantillon avec .un couple d'amorces 
oligonucleotiques choisi parmi les oligonucleotides definis a la revendication 5 ; 
I'acide nucleique contenu dans I'echantillon ayant ete, le cas echeant, rendu 
accessible aux dites amorces a la cible recherchee, 

(b) amplification de la sequence nucleique encadree par le couple 
d'amorces choisi, 

(c) verification de la presence du produit amplifie par utilisation d'au moins 
une sonde specifique du produit amplifie. 

13. Procede selon la revendication 12, selon lequel I'etape (c) comprend les 
sous-etapes suivantes : 

(cO denaturation des sequences amplifies par un moyen physique ou 
chimique, 
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(c 2 ) mise en contact avec une solution contenant les fragments amplifies 
denatures de I'etape (Ci) avec, d'une part, au moins une sonde de capture, et 
d'autre part, au moins une sonde de detection, eventuellement marquee, les 
sondes de capture et de detection ayant une sequence telle que definie a la 
revendication 1 , et susceptibles de s'hybrider avec le meme brin des fragments 
amplifies, ladite mise en contact etant realisee pendant un temps suffisant pour 
permettre la reaction d'hybridation, 

(c 3 ) au moins un lavage pour eliminer les sequences nucleiques n'ayant 
pas reagi, 

(c 4 ) revelation des sondes de detection hybridees aux sequences 
nucleiques amplifiees. 

14. Procede selon les revendications 12 ou 13, dans lequel la sonde de 
capture est fixee a la surface d'un puits d'une plaque de microtitration. 

15. Procede selon les revendications 12 ou 13, dans lequel la sonde de 
detection est marquee a la peroxydase. 

16. Procede selon rune quelconque des revendications 13 a 15, caracterise 
en ce que la mise en evidence de I'activite de la peroxydase liee a la sonde de 
detection ayant reagi, s'effectue par reaction colorimetrique, en presence d'un 
substrat chromogene, tel que le tetramethylbenzidine (TMB), par la mise en 
oeuvre des etapes suivantes : 

- addition du substrat chromogene, tel qu'une solution de TMB dans les 
puits contenant le melange reactionnel, 

- incubation, a I'obscurite, pendant un temps suffisant pour permettre le 
developpement de la coloration, 

- blocage de la reaction par addition d'une solution d'arret, 

- determination de la densite optique a une longueur d'onde appropriee. 

17. Procede de detection de E. coli 0157 :H7, selon Tune quelconque des 
revendications 12 a 16, mettant en oeuvre les oligonucleotides suivants : 
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- les sequences SEQ ID N°5 et SEQ ID N° 6, comme amorces, pour 
1'amplification, 

- la sequence SEQ ID N° 15, comme sonde de capture, 

- la sequence SEQ ID N° 18, comme sonde de detection. 

5 

18. Precede de detection des EHEC, selon Tune quelconque des 
revendications 12 a 16, mettant en oeuvre les oligonucleotides suivants : 

- les sequences SEQ ID N°21 et SEQ ID N° 22, comme amorces pour 
I'amplification, 

10 - la sequence SEQ ID N° 25, comme sonde de capture, 

- la sequence SEQ ID N° 27, comme sonde de detection. 

19. Trousse pour la detection de E . coli 0157 :H7 ou des EHEC, comprenant 
parmi les reactifs : 

15 - au moins deux oligonucleotides selon la revendication 5, utilises comme 

couple d'amorces, 

- eventuellement au moins une sonde oligonucleotidique selon la 
revendication 5, pour la detection du produit amplifie. 
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1 

51 

101 

151 

201 

251 

301 

351 
IS91 
401 

451 

501 

551 

601 

651 

701 

751 

801 

851 

901 

951 

1001 

1051 

1101 

1151 

1201 

1251 

1301 

1351 

1401 

1451 



CTGCAGTCCG 

CCGCAGGCCA 

ACCTTCCGGT 

AAATGTCGGC 

GCCAGTGAAC 

CCGGCAAGAA 

ATACCCTTCG 

TGACATCCAC 

< 

TCGTCAGTTG 

TCCCAGCAAT 

CAACATGCGA 

TCTTCCTGTT 

TAGCCGCTGA 

GATTTAACTC 

TGATTTTGAT 

AAAAAGATAT 

GATTATGGTC 

CGGAACATAC 

AACGTTTTGA 

GCCCGTCGAT 

CTGGGGAGAC 

GATTTAAAAC 

GACCTGGTAT 

TAAAAACGGG 

TTTATGTCAA 

GCGAAAGATA 

GACTGTGGCC 

CAGCGTCTCC 

GAGGAGCAGG 

ATATACCATC 



GAGATGAAAG 

TGATTTTTGT 

TGTTTCTCCA 

AAAACGGGGA 

CGTGCCACAC 

TGGTCGCAAA 

TCATCAACAC 

AAAGAAGGGA 

+ katP 

CGGCTTGGAA 

AGGTATATCC 

ATTTCCCTTA 

CTGATTCTTC 

TAAAAAAGAG 

CTCTGAGATT 

TATGCCACCA 

CAAAGATTTG 

ATTATGGTCC 

AGGACATATG 

ACCGCTGAAC 

TGCTGTGGCC 

CTGATGGTCC 

GCTGGGATTT 

ACTGGGGGCC 

AAACTTCAGA 

TCCTGAAGGC 

TCAGGGAAGC 

CTGATCGCGG 

TGAAAAATGT 

GACTGGGATG 

ACCAGTGGCC 



CACCACTGTG 
CACAGACTCA 
GCCAGTTAAG 
AGCATCAGAA 
TCCGGGCAGT 
CTCCCGCTCC 
GTACAAACCA 
ATATTCAGGT 
CCCCTTAGTA 
TGTTGCATCA 
ATCCGGAGCT 
TGGCGCTATC 
ACTCAAAATT 
ACACAGCCCT 
GATTTCAACA 
■ CTGACAACTT 
TTTCTTTATT 
ATGGCCGGGG 
AGCTGGCCGG 
AGTCAAGAAA 
TGACTGGTAA 
GCTGGCGGAA 
TGACAACAAG 
AACCTCTTGC 
CCCGGTGGAA 
TTTTTCACGT 
GAGGGCATAC 
ATTGGCGCAG 
GAAAAATAAA 
TGGAAGGAGC 



TGTACCCCAT 
ATGACTACCG 
CCAGCGGTTT 
GGGCGGGGGA 
ACATGCCGCC 
GTGCAGCGGG 
GAAGACCAGC 
CTGCGCAGCA 
TTTTTTGTCT 
ATAAAGTTGA 
ATTCGTATGA 
GGGGAGCTTT 
TCTACTATCC 
GAATCAAATC 
GCTGGATATG 
CCCAGGATTG 
CGTATGGCTT 
AGGCGCCAGT 
ATAACGTTAA 
AAATACGGCT 
TGTTGCCCTT 
GAGAAGATGA 
CCTCTTGCAG 
CGCCACGCAG 
AACCAGATCC 
ATGGCCATGG 
ATTTGGTAAA 
GGCCTGATGG 
TGTGGTACAG 
CTGGTCGAC 



CAGCGTGGTC 
GACGCACTGA 
CCCTGCTGAA 
ACTCCGTCCG 
GGCGCTGATA 
CTATTTCAGG 
TTTTTGTTTC 
CTCAACGGCA 
GTAGTATCTA 
CTTTTGTATA 
TAAAAAAAAC 
TCTACCGCTG 
AGAAACACTG 
CCTGGGGGGC 
GAGGCTCTGA 
GTGCCCTGCG 
GGCACGGTGC 
GGTGGTCAGC 
TCTGGATAAA 
CCAGTATTTC 
GAATCCATGG 
CTGGGAGTCG 
ATAACCGGGA 
ATGGGACTTA 
TCTGGCTTCC 
ATGATGAGGA 
GCACATGGTG 
TGCACCTGTG 
GAAACGGCAA 
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1 
51 
101 
151 
201 
251 
301 
351 
401 
451 
501 
551 
601 
651 
701 
751 
801 
851 
901 
951 
1001 
1051 
1101 
1151 



CTGCAGGAGA 
GCTCCAGCTG 
GTCCCCGT AT 
TGAACAAAAT 
CCCTTAGCCT 
ATCAAACCGG 
AGCGTTCCGG 
ACATCCCCCA 
AGGGATCCCG 
CTTCAGCCAG 
ACACTGGCAA 
TAACACATCT 
CTTCGTATTC 
CCTTCCATCT 
TTCGGGACGT 
ATGCAGCCCA 
TGCAATGCGG 
GACACCTTCC 
TGAAATCACA 
TAGGTTTTTT 
CAGTCCTGCT 
GTTTAAATTC 
AGGCTGTTCC 
TTCCGGAGCA 



TGGAAAAAAA 

AAAGTAGGCC 

TTAAACAATG 

TCGGGCTGAA 

GACTAGCCAG 

TACTCAATAT 

T CGGG AT AAA 

CGGGTAACAG 

CCCGTCTCAC 

TACCATACCA 

TCCGGTAGAC 

CCGCTCATTC 

TTCACGCCCG 

T C AGCTG AT A 

AGCATCCCCA 

GGCGTGGATA 

GCCAGTCGAA 

GCCATCAGAT 

CAGATAATTC 

GTCTGACAAT 

ATATTACTGT 

CCCGATAATC 

TGAAAGGAAT 

ATTTTACTTT 



GCCAAAATAA 
TGTTCTGTCC 
TGATAAATTA 
AAGAGGATCC 
AGACACAATG 
CTTCTCTGGC 
AAATCGCGCA 
CGTCCCTGTC 
TGGCGAT AAC 
AACGCTTCAT 
CGGTAACGCT 
CCAGGTGTTC 
GCGCCCACCA 
CAATACACGC 
CCTGAACGAT 
TGCAGGGGTA 
ACCCGGTGGA 
GCGCCATCAT 
AGGGAAAACG 
AGTGAAGCGG 
CATGGCCACT 
CGTCGAAGTC 
AAAAGTGACA 
TTTCTCTGCA 



AAAATTGCCC 
GGTATTTAAA 
CTCCGTTACC 
GCCGTTATCT 
ATCTGTGCCG 
GCTGGCTGCC 
GTGCGCCGGT 
ACATTCTTCT 
GGGCACGCCG 
TTTCCGAAGG 
GGGAAAAGGG 
TGTCTGCTGA 
CGAGCCAGCG 
AGCATAAATT 
AAGCGGAACA 
ACGGTCGCAT 
ATAACCGTTA 
GGGTGAGATA 
TTCTGGTCTT 
TGACAGCATA 
ATGGCAGATG 
TGAGGATGGA 
TCATGCCCTC 
G 



ATCCCAGCGC 
TGCATTGACC 
GGAAAACCGC 
GTTGCATTTC 
TTCTGTTAAT 
ATCATCCGGA 
CCATGCAGAC 
GAATGACATC 
GAGACTGACG 
CATGACCACC 
CACCTGCCAT 
CGCAGACGTG 
AAATGATTTC 
CATGTCCTTT 
TTGTCTGCTG 
GGCTTCATTA 
CCGGTGTCCT 
GGCACAACAA 
ACGGGTGATG 
TCAGACGGCT 
ACCAGATCAG 
AGGAAGGTGA 
TTTTTCTGGC 
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LISTE DE SEQUENCES 

(1) INFORMATION GENERALE 

(i) DEPOSANT : 

(A) NOM : PASTEUR SANOFI DIAGNOSTICS 

(B) RUE : 3 BOULEVARD RAYMOND POINCARE 

(C) VILLE : MARNES LA COQUETTE 

(D) PAYS : FRANCE 

(E) CODE POSTAL : 92430 

(ii) TITRE DE L'INVENTION : SEQUENCES NUCLEOTIDIQUES POUR 
LA DETECTION DES ESCHERICHIA COLI ENTEROHEMORRAGIQUES 

(iiD NOMBRE DE SEQUENCES : 27 

(2) INFORMATION POUR LA SEQUENCE ID N°1 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 1489 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°1 : 



1 


CTGCAGTCCG 


GAGATGAAAG 


CACCACTGTG 


TGTACCCCAT 


CAGCGTGGTC 


51 


CCGCAGGCCA 


TGATTTTTGT 


C AC AGACT C A 


ATGACTACCG 


GACGCACTGA 


101 


ACCTTCCGGT 


TGTTTCTCCA 


GCCAGTTAAG 


CCAGCGGTTT 


CCCTGCTGAA 


151 


AAATGTCGGC 


AAAACGGGGA 


AG C AT C AG AA 


GGGCGGGGGA 


ACTCCGTCCG 


201 


GCCAGTGAAC 


CGTGCCACAC 


TCCGGGCAGT 


ACATGCCGCC 


GGCGCTGATA 


251 


CCGGCAAGAA 


TGGTCGCAAA 


CTCCCGCTCC 


GTGCAGCGGG 


CTATTTCAGG 
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301 


ATACCCTTCG 


TCATCAACAC 


GTACAAACCA 


GAAGACCAGC 


TTTTTGTTTC 


351 


T G AC AT CC AC 


AAAG AAGG G A 


ATATTCAGGT 


CTGCGCAGCA 


CTCAACGGCA 


401 


TCGTCAGTTG 


CGGCTTGGAA 


CCCCTTAGTA 


TTTTTTGTCT 


GTAGTATCTA 


451 


TCCCAGCAAT 


AGGTATATCC 


TGTTGCATCA 


ATAAAGTTGA 


CTTTTGTATA 


501 


CAACATGCGA 


ATTTCCCTTA 


ATCCGGAGCT 


ATTCGTATGA 


TAAAAAAAAC 


551 


TCTTCCTGTT 


CTGATTCTTC 


TGGCGCTATC 


GGGGAGCTTT 


TCTACCGCTG 


601 


TAGCCGCTGA 


TAAAAAAGAG 


ACTCAAAATT 


TCTACTATCC 


AG AAAC AC T G 


651 


GATTTAACTC 


CTCTGAGATT 


ACACAGCCCT 


GAATCAAATC 


CCTGGGGGGC 


701 


TGATTTTGAT 


TATGCCACCA 


GATTTCAACA 


GCTGGATATG 


GAGGCTCTGA 


751 


AAAAAG AT AT 


C AAAG ATT TG 


CTGACAACTT 


CCCAGGATTG 


GTGCCCTGCG 


SOI 


GATTATGGTC 


ATTATGGTCC 


TTTCTTTATT 


CGTATGGCTT 


GGCACGGTGC 


851 


CGGAACATAC 


AG G AC AT AT G 


ATGGCCGGGG 


AGGCGCCAGT 


GGTGGTCAGC 


901 


AACGTTTTGA 


ACCGCTGAAC 


AGCTGGCCGG 


ATAACGTTAA 


TCTGGATAAA 


951 


GCCCGTCGAT 


TGCTGTGGCC 


AGTCAAGAAA 


AAATACGGCT 


CCAGTATTTC 


1001 


CTGGGGAGAC 


CTGATGGTCC 


TGACTGGTAA 


TGTTGCCCTT 


GAATCCATGG 


1051 


GATTTAAAAC 


GCTGGGATTT 


GCTGGCGGAA 


G AGAAG AT GA 


CTGGGAGTCG 


1101 


GACC TGGT AT 


ACTGGGGGCC 


TGACAACAAG 


CCTCTTGCAG 


ATAACCGGGA 


1151 


TAAAAACGGG 


AAACTTCAGA 


AACCTCTTGC 


CGCCACGCAG 


ATGGGACTTA 


1201 


TTTATGTCAA 


TCCTGAAGGC 


CCCGGTGGAA 


AACCAGATCC 


TCTGGCTTCC 


1251 


GCGAAAGATA 


TCAGGGAAGC 


TTTTTCACGT 


ATGGCCATGG 


AT GAT G AG G A 


1301 


GACTGTGGCC 


CTGATCGCGG 


G AGGGC AT AC 


ATTTGGTAAA 


GC AC ATGGTG 


1351 


CAGCGTCTCC 


TGAAAAATGT 


ATTGGCGCAG 


GGCCTGATGG 


TGCACCTGTG 


1401 


GAGGAGCAGG 


GACTGGGATG 


GAAAAATAAA 


TG TGGT AC AG 


G AAAC G GC AA 


1451 


AT AT AC CAT C 


ACCAGTGGCC 


TGGAAGGAGC 


CTGGTCGAC 





(2) INFORMATION POUR LA SEQUENCE ID N°2 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 1181 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : double 
(D) CONFIGURATION : lineaire 



THIS PAQE BLANK (usrro) 



WO 99/55908 



PCT/FR99/01000 



(E) BRIN ; sens 

di) TYPE DE MOLECULE : ADN (genomique) 
(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°2 : 

1 CTGCAGGAGA TGGAAAAAAA GCCAAAATAA AAAATTGCCC ATCCCAGCGC 

51 GCTCCAGCTG AAAGTAGGCC TGTTCTGTCC GGTATTTAAA TGCATTGACC 

101 GTCCCCGTAT TTAAACAATG TGATAAATTA CTCCGTTACC GGAAAACCGC 

151 TGAACAAAAT TCGGGCTGAA AAGAGGATCC GCCGTTATCT GTTGCATTTC 

201 CCCTTAGCCT GACTAGCCAG AGACACAATG ATCTGTGCCG TTCTGTTAAT 

2 51 ATCAAACCGG TACTCAATAT CTTCTCTGGC GCTGGCTGCC ATCATCCGGA 
301 AGCGTTCCGG TCGGGATAAA AAATCGCGCA GTGCGCCGGT CCATGCAGAC 

3 51 ACATCCCCCA CGGGTAACAG CGTCCCTGTC ACATTCTTCT GAAT GAC AT C 
401 AGGGATCCCG CCCGTCTCAC TGGCGATAAC GGGCACGCCG GAG AC T GAC G 
451 CTTCAGCCAG TACCATACCA AACGCTTCAT TTTCCGAAGG CATGACCACC 
501 ACAC TGGCAA TCCGGTAGAC CGGTAACGCT GGGAAAAGGG CACCTGCCAT 
551 (E££Cfl(EAT(E(E CECEGfiCEGfiCECEG GCfiGGTfiCECEfi (EG&GCEGffiEGfi SfiSSGACECBTG 

651 CCTTCCATCT TCAGCTGATA CAATAC AC GC AGCATAAATT CATGTCCTTT 

701 TTCGGGACGT AGCATCCCCA CCTGAACGAT AAGCGGAACA TTGTCTGCTG 

7 51 ATGCAGCCCA GGCGTGGATA TGCAGGGGTA ACGGTCGCAT GGCTTCATTA 

301 TGCAATGCGG GCCAGTCGAA ACCCGGTGGA ATAACCGTTA CCGGTGTCCT 

3 51 GACACCTTCC G C CAT C AG AT GCGCCATCAT GGGTGAGATA GGCACAACAA 

901 TGAAATCACA CAGATAATTC AGGGAAAACG TTCTGGTCTT ACGGGTGATG 

951 TAGGTTTTTT GTCTGACAAT AGTGAAGCGG T GAC AG CAT A TCAGACGGCT 

1001. CAGTCCTGCT AT AT T AC T G T CATGGCCACT ATGGCAGATG AC C AGAT C AG 

1051 GTTTAAATTC CCCGATAATC CGTCGAAGTC TGAGGATGGA AGGAAGGTGA 

1101 AGGCTGTTCC TGAAAGGAAT AAAAGTGACA TCATGCCCTC TTTTTCTGGC 

1151 TTCCGGAGCA ATTTTACTTT TTTCTCTGCA G 
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(2) INFORMATION POUR LA SEQUENCE ID N°3 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 
(A) LONGUEUR : 22 paires de bases 

<B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 



(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°3 : 

CGGAGATGAAAGCACCACTGTG 

(2) INFORMATION POUR LA SEQUENCE ID N°4 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 22 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 

(h) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°4 : 

GGGCTGTGTAATCTCAGAGGAG 

(2) INFORMATION POUR LA SEQUENCE ID N°5 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 25 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 
(D) CONFIGURATION : lineaire 
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(E) BRIN : sens 
di) TYPE DE MOLECULE : ADN (genomique) 

<iib DESCRIPTION DE LA SEQUENCE : SEQ ID N°5 : 

GTCCGGAGATGAAAGCACCACTGTG 

(2) INFORMATION POUR LA SEQUENCE ID N°6 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 25 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

CD) CONFIGURATION : lineaire 

CE) BRIN : antisens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°6 : 

TCAGGGCTGTGTAATCTCAGAGGAG 

(2) INFORMATION POUR LA SEQUENCE ID N°7 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 
(A) LONGUEUR : 23 paires de bases 

CB) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

CD) CONFIGURATION : lineaire 

CE) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(in) DESCRIPTION DE LA SEQUENCE : SEQ ID N°7 : 

GGCGCTGATACCGGCAAGAATGG 
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(2) INFORMATION POUR LA SEQUENCE ID N°8 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 23 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 
fD) CONFIGURATION : lineaire 
(E) BRIN : sens 

(ii> TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°8 

GGTCCCGCAGGCCATGATTTTTG 

(2) INFORMATION POUR LA SEQUENCE ID N°9 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 24 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 
fD) CONFIGURATION : lineaire 
(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°9 

CCGGCAAGAATGGTCGCAAACTCC 



(2) INFORMATION POUR LA SEQUENCE ID N°1 0 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 26 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 
(D) CONFIGURATION : lineaire 
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CE) BRIN : antisens 
<ii> TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°10 

AAGGGGTTCCAAGCCGCAACTGACGA 

(2) INFORMATION POUR LA SEQUENCE ID N°1 1 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 26 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 

<ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°t1 

TAAGGGGTTCCAAGCCGCAACTGACG 

(2) INFORMATION POUR LA SEQUENCE ID N°1 2 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 
(D) CONFIGURATION : lineaire 
CE) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°12 

CTCAACGGCATCGTCAGTTGCGGCTTGGAAC 
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(2) INFORMATION POUR LA SEQUENCE ID N°13 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°13 

AGCACTCAACGGCATCGTCAGTTGCGGCTTG 

(2) INFORMATION POUR LA SEQUENCE ID N°14 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°14 

CTATTTCAGGATACCCTTCGTCATCAACACG 

(2) INFORMATION POUR LA SEQUENCE ID N°15 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 
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( D) CONFIGURATION : lineaire 

(E) BRIN : sens 

<ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°15 

AATTTCCCTTAATCCGGAGCTATTCGTATGA 



(2) INFORMATION POUR LA SEQUENCE ID N°16 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 20 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

<io TYPE DE MOLECULE : ADN (genomique) 

<iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°16 

GAAGACCAGCTTTTTGTTTC 

(2) INFORMATION POUR LA SEQUENCE ID N°1 7 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 20 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°17 
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TGT CACAGAC T CAAT GAC T A 

(2) INFORMATION POUR LA SEQUENCE ID N°18 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 14 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

do TYPE DE MOLECULE : ADN (genomique) 

(hi) DESCRIPTION DE LA SEQUENCE : SEQ ID N°18 : 

GGCATCGTCAGTTG 



(2) INFORMATION POUR LA SEQUENCE ID N°19 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 16 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(io TYPE DE MOLECULE : ADN (genomique) 

(in) DESCRIPTION DE LA SEQUENCE : SEQ ID N°19 : 

CGGCATCGTCAGTTGC 

(2) INFORMATION POUR LA SEQUENCE ID N°20 . 
(i) CARACTERISTIQUE DE LA SEQUENCE : 
(A) LONGUEUR : 18 paires de bases 



• 
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(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

<ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°20 

ACGGCATCGTCAGTTGCG 

(2) INFORMATION POUR LA SEQUENCE ID N°21 : 

(i) CARACTERISTIQUE DE LA SEQUENCE: 

(A) LONGUEUR : 22 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°21 

CCACCTGAACGATAAGCGGAAC 



(2) INFORMATION POUR LA SEQUENCE ID N°22 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 22 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 



• 
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TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°22 

CACCTTCCTTCCATCCTCAGAC 

(2) INFORMATION POUR LA SEQUENCE ID N°23 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 
<A) LONGUEUR : 20 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii> TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°23 

ATCCCAGCGCGCTCCAGCTG 

(2) INFORMATION POUR LA SEQUENCE ID N°24 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 22 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°24 

ACC C AT GAT GG C G CAT C T GAT G 



• 
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(2) INFORMATION POUR LA SEQUENCE ID N°25 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

<ii) TYPE DE MOLECULE : ADN (genomique) 

<iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°25 

ACGTTCTGGTCTTACGGGTGATGTAGGTTTT 

(2) INFORMATION POUR LA SEQUENCE ID N°26 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucleique 

(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(hi) DESCRIPTION DE LA SEQUENCE : SEQ ID N°26 

TAGTGAAGCGGTGACAGCATATCAGACGGCT 

(2) INFORMATION POUR LA SEQUENCE ID N°27 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 21 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 
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(ii) TYPE DE MOLECULE : ADN (genomique) 

din DESCRIPTION DE LA SEQUENCE : SEQ ID N°27 

G T GAG AT AG G C AC AAC AAT G A 
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(57) Abstract 



The invention concerns nucleic sequences of plasmid origin, present in bacteria of the group enterohemorrhagic Escherichia coli 
(EHEC), the use of said sequences for searching for EHEC, in particular those having genes coding for enterohemolysin and intimin 
virulence factors, and more particularly for specific detection of the 0157:H7 serotype. The invention also concerns a method using said 
sequences and detection kits containing them. 



(57) Abrege* 

La prdsente invention a pour objet des sequences nucleiques d'origine plasmidique, pr^sentes chez les bacteries du groupe Escherichia 
coli enteroh^morragiques (EHEC), l'utilisation desdites sequences pour la recherche des EHEC, notamment ceux poss6dant les genes codant 
pour les facteurs de virulence ent6roh6molysine et intimine, et plus particulierement la d6tection specifique du s6rotype 0157:H7. LMnvention 
vise egalement un proced6 mettant en oeuvre lesdites sequences ainsi que les trousses de ddtection les contenant. 
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